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Анализ устойчивости методов нечеткой 
кластеризации к выбору их параметров 


В статье проводится анализ оптимизационных методов нечеткой кластеризации ЕСМ, МС, РСМ, ЕКС. 
Рассматриваются вопросы определения значений параметров методов нечеткой кластеризации: начальных 
значений центроидов и параметров доверительных границ основных кластеров. Исследуется проблема 
устойчивости решений задачи нечеткой кластеризации к определению значений указанных параметров. 


Введение 


Одной из важнейших проблем практического применения методов нечеткой клас- 
теризации является неустойчивость их решений к наличию аномальных наблюдений 
в исследуемой совокупности наблюдений. Под аномальными наблюдениями здесь по- 
нимаются наблюдения, принадлежащие классам, число представителей которых в ис- 
следуемой совокупности существенно мало в сравнении с числом представителей ос- 
новных классов. 

Для решения задачи нечеткой кластеризации в условиях наличия в исследуемой 
совокупности аномальных наблюдений разработаны специальные оптимизационные 
методы, которые принято называть робастными [1]. Среди наиболее известных робаст- 
ных методов нечеткой кластеризации необходимо выделить методы: №15е Сшуение 
(МС) [2], Роз Шзйс С-Меапз (РСМ) [3], Еи2хту Коби Стазегие (ЕКС) [4]. 

Несмотря на широкое применение указанных методов, необходимо отметить 
недостаточное внимание, которое уделено вопросу выбора значений их параметров. 
Существование проблемы выбора значений параметров кластеризации для произ- 
вольной совокупности наблюдений признается исследователями и нашло отражение 
в немногочисленных рекомендациях [1-4]. 

В данной работе исследуется проблема устойчивости решений задачи кластери- 
зации оптимизационных методов МС, РСМ, ЕКС по отношению к определению значе- 
ний параметров кластеризации: начальных значений центроидов и значений парамет- 
ров доверительных границ основных классов, — а также анализируются рекомендации 
по определению значений указанных параметров на основе предварительного анализа 
исследуемой совокупности. 


Проблема выбора значений параметров 
методов нечеткой кластеризации 


Основой для разработки большинства оптимизационных методов нечеткой клас- 
теризации послужил целевой функционал Дж. Данна и Дж. Беждека [5], лежащий в 
основе классического метода нечеткой кластеризации Ея72ту С-Меапз (ЕСМ): 


Рим (Р)=УУ а, (1) 


+ = 
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где Р - нечеткое с -разбиение исследуемой совокупности наблюдений Х на задан- 
ное число с нечетких множеств А’, 1=1,...,С; а, =А(х,т,) — функция расстояния от 
наблюдения х, Е Х` до центроида г, нечеткого кластера А’ е {А`'...., 4°}; У:1<у < — 
показатель нечеткости кластеризации; д, = и‚(х,): д, >20 — функция принадлежности 


7 Е 
наблюдения х, нечеткому кластеру А’, удовлетворяющая условию: 


У =1. (2) 


Попытки решения проблемы устойчивости метода ЕСМ к аномальным наблюде- 
ниям привели к появлению методов МС, РСМ, ЕВС. Указанные методы кластеризации 
допускают, что исследуемой совокупности могут принадлежать наблюдения неоснов- 
ных классов, что приводит к ослаблению условия (2): 


ОЕ (3) 
1 


где С — число основных классов, задаваемое до процедуры кластеризации. 
Целевые функционалы методов МС, РСМ и ЕКС могут быть представлены соот- 
ветствующими выражениями: 


Еж(Р)=УУ а: +6" а-У и), (4) 
У у Ри 
РЕ аа о УИ (5) 
а м я 
Еис(Р)= У. Уи, + У (+ и, вру) шуб? , (6) 


1=1 Л = У 
где у, р - показатели нечеткости кластеризации; д, {0,}_, — параметры, определяю- 
щие доверительные границы основных кластеров. 

Оптимизационную процедуру поиска экстремума вышеуказанных функционалов 
предваряет задание числа основных классов и выбор начальных значений центроидов, 
показателей нечеткости кластеризации и параметров, определяющих доверительные 
границы основных кластеров. Выбор значений параметров для кластеризации произ- 
вольной совокупности наблюдений является открытым вопросом нечеткой кластери- 
зации. 


Задача выбора начальных значений центроидов 


Одним из важных вопросов, связанных с применением оптимизационных мето- 
дов, разработанных для задач кластеризации в условиях возможного влияния аномаль- 
ных наблюдений, является вопрос выбора начальных значений центроидов. 

В работах [1-4], описывающих наиболее известные робастные методы нечеткой 
кластеризации, сообщается о важности правильного выбора начальных значений цент- 
роидов ввиду их влияния на конечные результаты кластеризации. Но сама проблема 
устойчивости решений задачи кластеризации к выбору начальных значений центрои- 
дов как таковая не рассматривается. 

В вышеупомянутых работах даются краткие рекомендации по определению на- 
чальных значений центроидов в случае отсутствия предварительной информации о рас- 
пределении наблюдений основных классов исследуемой совокупности. 
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В работе [1] при использовании робастных методов кластеризации предлагается 
выполнять итерационную процедуру оптимизационного поиска оптимального разбие- 
ния поочередно для всех возможных начальных значений центроидов, после чего осу- 
ществлять оценку полученных разбиений и выбирать на ее основании оптимальный 
результат кластеризации. При этом в качестве возможных начальных значений цент- 
роидов рекомендуется рассматривать все наблюдения исследуемой совокупности, 
хотя очевидно, что такая рекомендация неприемлема в вычислительном плане. 

В работе [4] для метода ЕВС предлагается рассматривать не все возможные наб- 
людения в качестве начальных значений центроидов, а лишь наиболее удаленные друг 
от друга. 

В работе [3] рекомендуется для определения начальных значений параметров 
метода РСМ делать предварительную оценку исследуемой совокупности каким-либо 
другим методом кластеризации. 

Для исследования устойчивости методов кластеризации ЕСМ, МС, РСМ, ЕВС к 
выбору начальных значений центроидов представим целевые функционалы методов 
как функции от центроидов Е =Ё(т) (где т=(т,т.,..т.) — вектор центроидов основных 
кластеров) при заданной исследуемой совокупности наблюдений и определенных па- 
раметрах кластеризации д, {0,} 1, У и р с учетом оптимальности выбора парамет- 


ров 14, в соответствии с выражениями из [2-5]: 

1 1 

р РЯ 
4 аьх,) | 


и И" (г)= у : (7) 


| 4” (т,ьх,) 


—1 
1 1 
4” (тьх,) 7 ке 4 (тьх,) 7 


№ (т) = О ЕЕ (8) 
Из (т) 52 2 1х) 
1 —1 
а?(т,,х,)\7 
лы В (9) 
5, 
а?(тьх,)\” 
т(еутек | б5® || (0) 
5 
Таким образом, целевые функционалы примут вид: 
Енем (г) = У, Уи’ (ва? (т, х,); (р 
УЕ 2 
Ехс(т) = у ат 5} У5?а == Уи (г) ; (12) 
Е = 1= 
Ерсм (т) = Уса @х) г У а = ил(т,)’ › (13) 
УЕ 2 — 


[6] Ш 


Еквс (т) -- УХУ ие)?” (е,д,) + УУ( р из (т, ю5(и (т,)) ие ие) - (14) 


ЛЕГ 11 1=1 = 
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Исследуем проблему выбора начальных значений центроидов на элементарном 
частном примере. Пусть необходимо решить задачу кластеризации совокупности наб- 
людений Х’, заданных в одномерном пространстве в соответствии с табл. 1. 


Таблица 1 — Пример исследуемой совокупности наблюдений 


Х1 Х› Хз Х4 Х5 Х6б 


—0,1 | —0,05 0 0,05 | 0,1 2 


Пусть определено число основных классов с =1. Очевидно, наблюдение х, сле- 


дует считать аномальным по отношению к основному классу, представленному наблю- 
дениями {х,,х,,х,,х.,х.}. 


Пусть определены значения параметров кластеризации согласно табл. 2. 


Таблица 2 — Пример исследуемой совокупности наблюдений 


Наименование параметра ЕСМ МС РСМ ЕКС 
Число основных классов с=1 с=1 с=1 с=1 
Доверительная граница основных кластеров = 9 =0,3 9 = 9 = 0,3 
Показатель нечеткости кластеризации 7=2 7=2 у=2 р=1 


Рассмотрим однопараметрические функции Е =Е(т) (11) - (14), соответствую- 
щие каждому из методов ЕСМ, МС, РСМ и ЕКС, построенные для заданной совокуп- 
ности наблюдений. 

Функция ЁР»см (т) имеет один локальный экстремум в точке, смещенной относи- 
тельно действительного центроида основного кластера в сторону аномального наблю- 
дения (рис. Та). 

В данном случае можно утверждать, что поиск оптимального разбиения мето- 
дом ЕСМ приведет к решению, соответствующему смещению центроида основного 
кластера относительно действительного расположения. Учитывая единственность экс- 
тремума функции Руси (г), можно говорить об отсутствии влияния выбора начального 
значения центроида на результат кластеризации методом ЕСМ. Стоит заметить, что это 
утверждение нельзя обобщить на общий случай для произвольного числа кластеров. 


Ы [=] 
ог 


Рисунок 1 — Графики функций Г»см (т) (а); 
Евкс(т)- «---», Еус(т) и Еьсм (т) —«-» (6) 
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Функции Р\с(т), Ерсм (т), Ерьс(т) имеют два локальных экстремума: в точке, 


близкой к действительному центроиду основного кластера, и в точке, близкой к ано- 
мальному наблюдению (рис. 1 6). 

Таким образом, при использовании методов МС, РСМ и ЕКС в качестве конеч- 
ного результата кластеризации заданной совокупности может быть получено одно из 
двух решений: верное, соответствующее совпадению центроида с действительным цент- 
роидом основного кластера, или ложное с центроидом в точке, близкой к аномальному 
наблюдению. Ложное решение возможно, если начальное значение центроида принад- 
лежит локальной области аномального наблюдения. 

Данный пример показывает различие влияния выбора начального значения цент- 
роида на решения робастных методов МС, РСМ и ЕКС в сравнении с методом ЕСМ. 

При условии корректного выбора начальных значений центроидов отклонение 
решений робастных методов МС, РСМ и ЕКС от действительных центроидов основ- 
ных классов в условиях аномальных наблюдений существенно мало в сравнении с ре- 
шениями метода ЕСМ. Это может быть объяснено характерным свойством целевых 
функционалов методов МС, РСМ и ЕКС, которое выражается в незначительном из- 
менении доли, вносимой аномальными наблюдениями в значения функционалов, в 
случае изменения положения центроидов в локальной области основных кластеров [6]. 
Иными словами, поиск оптимального значения центроида робастными методами осу- 
ществляется среди наблюдений локальной области заданного начального значения 
центроида, в отличие от метода ЕСМ, для которого на решение задачи кластеризации 
одинаково влияют все наблюдения исследуемой совокупности. Это также объясняет 
то, что ошибочный выбор начального значения одного из центроидов в области ано- 
мального наблюдения неминуемо приводит робастные методы к ложному решению. 

Рассмотренный пример показывает влияние ошибки выбора начального значе- 
ния центроида на результат поиска оптимального положения отдельно взятого цент- 
роида. Учитывая особенность некоторых методов решать задачу нечеткой кластериза- 
ции при условии взаимозависимости центроидов, целесообразно исследовать влияние 
ошибки инициализации одного центроида на общее решение задачи кластеризации 
для случая нескольких кластеров. 

Для этого рассмотрим следующую элементарную задачу кластеризации наблю- 
дений в одномерном признаковом пространстве для случая двух основных кластеров. 
Пусть исследуемая совокупность состоит из двух наблюдений х, =0 их, =1. Заданную 
совокупность можно считать прототипом двух компактных хорошо разделимых клас- 
теров одинаковой мощности. Пусть определены значения параметров кластеризации 
согласно табл. 2. 

На рис. 2 представлены функции Р/с (т), Е\с(т), Ежи (т), Ежс(т) (11) - (4), 


характеризующие значения соответствующих целевых функционалов при различном 
расположении центроидов относительно фиксированных значений наблюдений. 
Заметим, что все указанные функции имеют глобальные экстремумы, соответ- 
ствующие действительным значениям центроидов. 
Как известно, функционалы Е„„(Р) и Е.„(Р) представимы как суммы независи- 


мых оценок оптимальности расположения каждого отдельного центроида основного 
кластера [1]. Поэтому методы ЕКС и РСМ допускают совпадение оптимальных зна- 
чений центроидов (1,1) = (х,х,) и (1,т,) = (х,,х.). 
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Г 
Рисунок 2 — Графики функций Е»си (т) (а), Ехс(т) (6), Еьсм (т) (в), Екьс(т) (Г) 


Пусть для центроида г, найдено ложное устойчивое положение вне локальной об- 


ласти основных кластеров (т, << х или т, >> х,). Тогда, как следует из графиков, для 
методов МС, РСМ и ЕКС оптимальным положением центроида г, являются действи- 
тельные центроиды основных кластеров (т, =х и г, =х,). Для методов РСМ и ЕВС 


это обусловлено независимостью оценок оптимальности расположения центроидов. 
Заметим, что метод МС, подобно методам РСМ и ЕКС, в случае ошибки инициализации 
одного из центроидов позволяет верно определять оптимальное положение остальных. 
Представленное свойство закономерно, поскольку влияние совокупности наблюдений 
на оценку оптимального положения центроида ограничено локальной областью. При тех 
же условиях для метода ЕСМ оптимальным положением центроида г, является точка, 
равноудаленная от действительных центроидов основных кластеров: г, = (х +х,)/2. 
Таким образом, ошибка выбора начального значения одного центроида приводит к 
ошибке решения задачи кластеризации в целом. 

Вышеприведенные примеры позволяют сформировать представление о послед- 
ствиях ошибочного выбора начальных значений центроидов. 

Пользуясь выводами проведенного исследования, можно утверждать, что неко- 
торые рекомендации [1-4] по выбору начальных значений центроидов для робастных 
методов являются в общем случае неправомерными. При выборе начальных значений 
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центроидов среди наиболее удаленных друг от друга наблюдений, либо среди произ- 
вольных наблюдений исследуемой совокупности, велика вероятность выбора аномаль- 
ного наблюдения в качестве центроида, что может привести к нахождению ложного 
разбиения. Многократное решение задачи кластеризации при переборе значений па- 
раметров инициализации трудоемко и не всегда доступно исследователю. 

Рекомендацию использования процедуры предварительной оценки исследуемой 
совокупности с помощью альтернативного метода кластеризации, не обязательно не- 
четкого, для определения начальных значений центроидов, приведенную в [3], следует 
считать применимой не только для метода РСМ, но и для методов МС и ЕКС. При ис- 
пользовании метода ЕСМ для предварительной оценки необходимо помнить о чувст- 
вительности решений данного метода к аномальным наблюдениям. 


Задача выбора значений параметров 
доверительных границ основных кластеров 


Целевой функционал Р(Р) методов МС, РСМ, ЕВС может быть охарактеризован 
показательной функцией О = О(х), значение которой в произвольной точке х являет- 
ся некоторой долей, вносимой наблюдением х в общую оценку разбиения Р при ус- 
ловии принадлежности х исследуемой совокупности [6]. Функции 0(х) методов МС, 


РСМ, ЕВС ограничены во всем признаковом пространстве и имеют асимптотическое 
поведение вне локальных областей заданных центроидов основных кластеров. Данное 
свойство позволяет ограничить влияние на оценку разбиения аномальных наблюде- 
ний, находящихся вне определенных локальных областей центроидов основных клас- 
теров. Размер каждой из таких локальных областей центроидов определяется соотве- 
тствующим параметром доверительной границы основного кластера, что объясняет 
чувствительность решения задачи кластеризации к выбору значений этих параметров. 
Обобщим рекомендации по выбору значений параметров доверительных гра- 


ниц основных кластеров д, {0.},, приведенные в работах [1-4], [7]. В соответствии 
с указанными источниками значения параметров д, {0,}, должны быть установлены 
на этапе, предваряющем процедуру кластеризации методами МС, РСМ и ЕКС. В про- 
цессе кластеризации значения выбранных изначально параметров д, {0,}., не изме- 


няются или корректируются. 
Согласно работе [2] параметр д для метода МС предлагается выбирать в соот- 
ветствии с выражением: 


Я Ш [6 
= УУ ах, т), (15) 

По 
где Я — масштабирующий параметр; с — число кластеров; т, — центроид нечеткого 
кластера А'е{А',..., А°} ; И — количество наблюдений исследуемой совокупности. В дан- 
ной рекомендации для определения значений параметров Й и {т,}_‚ требуется оценка 


исследуемой совокупности, предваряющая инициализацию параметра д. 
Авторы работы [7] предлагают избежать предварительного определения значе- 


ний центроидов {7,}_ ‚ используя для выбора значения параметра д выражение: 


д=аг, (16) 
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где а — масштабирующий параметр, г — радиус с равновеликих гиперобъемов ми- 
нимального размера, выделенных в признаковом пространстве и способных вместить 
все наблюдения исследуемой совокупности. Для использования данной рекоменда- 
ции исследователю необходимо самостоятельно определить алгоритм выделения ги- 
перобъема. 


В работах [1], [3], [4] для выбора значений параметров {0.}_/ методов РСМ и ЕВС 
предлагается использовать результаты предварительной кластеризации. В частности, 
начальные значения {0}. рекомендуется определять как взвешенные внутриклассо- 


вые расстояния соответствующих кластеров {А'}°: 


д 
5=^ У ®4(хт,), (17) 


п; Хх 7 Е(Р; = 
где А — масштабирующий параметр; и, — нормирующий коэффициент, оценивающий 


количество наблюдений нечеткого кластера А’, в качестве которого могут выступать 
КР) — мощность подмножества @ -уровня нечеткого с -разбиения Р исследуемой со- 


Ш 
вокупности наблюдений Х’, либо У и; — сумма степеней принадлежности наблюде- 
= 
>“ 7. > >“ 
ний кластеру А'; @,,@, & [0, 1] — весовой коэффициент, характеризующий оценку при- 


7? 
надлежности наблюдения х, нечеткому кластеру А’, в качестве которого могут ис- 
пользоваться значения степеней принадлежности /4,. 
В работе [4] предлагается выбирать начальные значения параметров {0,} функцио- 
налов Реи(Р) и Е.‚с(Р) в соответствии с выражением: 
Ь КЯГ, (18) 


д, = тит, =, Е: 


1 


> с 
причем в качестве начальных значении центроидов Е: допускается выбирать наб- 


людения, находящиеся на наибольшем удалении друг от друга. 

Для оценки данных рекомендаций проведем исследование устойчивости роба- 
стных методов кластеризации к выбору значений параметров доверительных границ 
основных кластеров. 

Представим целевые функционалы Р„„(Р) и Е.„с(Р) как суммы компонент К(т,,6,), 
1=1,....с, каждый из которых является оценкой оптимальности расположения цент- 
роида т, с соответствующим ему параметром д, по отношению к исследуемой сово- 


купности наблюдений: 


Е(Р)=УКе,6), (19) 
Крем (т,0)= Ум е,х,) + а =, (#))’, (20) 
Вик(,6) = Ха, +6* > (и ева ))-м (2). © 


Исследуем проблему выбора параметров доверительной границы основных клас- 
теров на элементарном частном примере. Пусть необходимо решить задачу кластери- 
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зации совокупности наблюдений Х’, заданных в одномерном пространстве в соответ- 
ствии с табл. 3. 


Таблица 3 — Пример исследуемой совокупности наблюдений 


х1 х2 х3 х4 х5 хб х7 | х8 | х9 |х|[0 | х|1 | х12 
—0,125 | -0,075 | -0,025 | 0,025 | 0,075 | 0,125 | 0,85 | 0,9 | 0,95 | 1,05 | 1,1 | 1,15 


Исследуемая совокупность Х’ (табл. 3) представлена двумя хорошо разделимы- 
ми классами одинаковой мощности с центрами в точках 0 и 1. 

На рис. 3 представлены графики функций Аи (7,0) и Кс (1,0) при разных зна- 
чениях параметра дб. 


В[=] В [=] 


Рисунок 3 — Графики функций Кки«-», Ке«--» 


при значении параметра д = 0,2 (а) ид =0,9 (6) 


Графики показывают, что в зависимости от выбора значения параметра 6 ‚ функ- 
ции Ари (т,0) и Кс (т,0) могут иметь различное число локальных экстремумов. 

В случае выбора значения параметра 6, близкого к значению расстояния от 
действительного центроида основного кластера до наиболее удаленного наблюдения 
этого кластера, функции Аи (т,0) и Кс (1,0) имеют два локальных экстремума в 
точках, близких к центрам классов. 

При выборе значения параметра 6 , превышающего половину расстояния между 
центрами классов, функции Ари (т,0) и Кс (1,0) вырождаются в функции, имеющие 
один локальный экстремум. Это может быть объяснено пересечением доверительных 
границ основных кластеров и их объединением в один кластер. При таком выборе 
значения д оптимальным расположением центроида является точка, находящаяся 
между действительными центрами кластеров. 

При выборе значения параметра б значительно меньше значения расстояния 
от действительного центроида основного кластера до наиболее удаленного наблюде- 
ния этого кластера вероятно появление нескольких экстремумов функций Ами (т,0) 


и Ас (т,0) , соответствующих одному и тому же основному кластеру (рис. 4). Такое 


разделение кластера возможно в случае, если наблюдения распределены по закону, от- 
личному от нормального. 
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В|[ =] 


0.034 | 


1 -0.5 0.5 1 1.5 2 
Рисунок 4 — Графики функций Аки «-», В с «--» при значении параметра б = 0,05 


Вышеприведенные примеры позволяют сформировать представление о послед- 
ствиях ошибочного выбора параметров доверительных границ основных кластеров. 

Отметим еще одну важную особенность робастных методов РСМ и ЕВС. Упо- 
мянутые методы кластеризации допускают выбор различных параметров доверитель- 
ных границ для различных основных кластеров. Пусть для двух кластеров А; и 4, 


определены соответственно значения параметров доверительных границ д, и д, , при- 
чем д, >д, . Тогда для любой невырожденной выборки для любых значений г спра- 
ведливо неравенство: 
В(,0,) > В(Ф,д,). 
Это свойство функций Ами (т,0) и К„с(т,0) является следствием выражений 
(20) и (21). Данное свойство исключает возможность сравнения оценок разбиения 
Е»см(Р) и Екс(Р) , полученных при выборе различных значений параметров {6,} . 


Результаты проведенного исследования позволяют выявить характер последст- 
вий ошибочного выбора значений параметров доверительных границ основных клас- 
теров. Заметим неправомерность некоторых рекомендаций. 

При выборе значения каждого из параметров 0., 1=1.....с как расстояния 


между центроидами таит, г, нар } К =, согласно [4], велика вероятность объеди- 


1 


нения кластеров А" и А', что не соответствует действительному разбиению. 

Изменение значений параметров {0.} согласно [3] в рамках многократного вы- 
полнения процедуры оптимизационного поиска решения не позволяет оценивать ре- 
зультаты кластеризации, непосредственно сравнивая значения функционалов. Для срав- 
нения должны быть использованы иные критерии оценки разбиения. 

Для правильного выбора значений параметров бд, {0.} методов МС, РСМ и ЕКС 
обязательным условием должно быть наличие некоторой предварительной оценки рас- 
пределения каждого основного класса исследуемой совокупности. 

Представленные в [2], [3] рекомендации выбора значений параметров д , {0,} ‚ ос- 
нованные на предварительной оценке совокупности наблюдений с помощью альтерна- 


тивного метода кластеризации, следует считать применимыми не только для методов 
МСи РСМ, но и для метода ЕКС. 
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Выводы 


Как известно, наличие аномальных наблюдений в выборке приводит к сущест- 
венным ошибкам решений задачи нечеткой кластеризации с использованием класси- 
ческого метода ЕСМ. Решение проблемы может быть найдено в применении робастных 
методов кластеризации, среди которых наиболее известными являются методы МС, 
РСМ и ЕКС. Следует заметить, что ослабление влияния аномальных наблюдений на 
решения задачи кластеризации методами МС, РСМ и ЕКС достигается с помощью вы- 
деления некоторых доверительных областей основных кластеров. Наблюдения, находя- 
щиеся вне доверительных областей основных кластеров, вносят приблизительно оди- 
наковую долю в общую оценку разбиения и не оказывают значительного влияния на 
результаты кластеризации. Применение указанных робастных методов нечеткой клас- 
теризации осложняется проблемой определения значений их параметров, характери- 
зующих доверительные области основных кластеров. 

В данной работе проведен анализ влияния ошибки определения параметров ме- 
тодов кластеризации МС, РСМ и ЕБС: начальных значений центроидов и параметров 
доверительных границ основных кластеров. Проведено сравнение устойчивости реше- 
ний робастных методов кластеризации МС, РСМ и ЕКС и метода ЕСМ к выбору на- 
чальных значений центроидов. На примере методов РСМ и ЕКС исследовано влияние 
ошибки определения значений параметров доверительных границ основных кластеров. 

На основании частных элементарных примеров сделан вывод о неправомерности 
некоторых авторских рекомендаций упрощенного выбора значений указанных параметров. 

В рамках исследований была установлена необходимость предварительной оцен- 
ки распределения основных классов исследуемой совокупности наблюдений для оп- 
ределения значений параметров робастных методов МС, РСМ и ЕКС и возможность 
использования с этой целью методов кластеризации. 
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К.М. Залеська 

Анал стШкост! методв нечтко! кластеризацй щодо вибору 1х параметр!в 

Проводиться анал!з оптимзащйних методв нечтко! кластеризацй ЕСМ, МС, РСМ, ЕКС. Розглядаються 
питання щодо визначення значень параметр!в метод нечитко! кластеризацй: початкових значень центров 1 
параметрив дов1рчих меж основних кластерйв. Досл1джуеться проблема стйкост! рипень задач! нечётко! 
кластеризаци в1дносно визначення значень вказаних параметрав. 


К.М. щезКауа 

Те Апа1у$15 о Еи77у Си$егто Мейо4$ Ува Шиу 0 Фе Свое оЁ Тег Рагатеег$ 

ТБе апа[у$15 оЁ орнпихайоп оЁ Влтту сазегие тефо4$ ЕСМ, МС, РСМ, ЕБС 1 еше таде. ТВе диезНоп 
ор 4ейш®оп оЁ рагатеег$ уаез оЁ Влху сазепие те#о4 зисЬ аз и а| уа[лез оЁ сепго14$ ап4 Фе рагатеег 
оё фе рита| сазег сопЯ4епсе Шпи$ 1$ Бешя сопз14еге4. ТВе диезНоп оЁ Фе заб Ииу оЁ Влтту сазеппе 
ргоет зо[айоп УИ геегепсе {0 Фе дейшиоп ое рагатеег$ зрес1Йе4 уае$ 1$ Бешо гезеагсве4. 
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